طبقه‏بندی داده های نامتوازن در تشخیص اولیه بیماری های پستان با روش های آدابوست، شبکه عصبی احتمالی و k تا نزدیک‏ترین همسایه

نویسندگان

محمد درزی

mohammad darzi آسیه الفت بخش

asiye olfat bakhsh سعید گرگین

saeid gorgin فرید اویسی

farid oveisi عصمت هاشمی

چکیده

چکیده مقدمه: سرطان پستان یکی از سرطان‏های شایع در ایران بوده و هرگونه اقدام تشخیصی به هنگام در این مورد می‏تواند جان بسیاری از مبتلایان به این سرطان را نجات بخشد. هدف از این پژوهش طبقهبندی دادههای نامتوازن مربوط به بانوان مراجعه‏کننده به کلینیک پژوهشکده سرطان پستان جهاددانشگاهی به منظور تعیین وضعیت ایشان و طبقهبندی نرمال و یا غیرنرمال بودن پستان مراجعه‏کنندگان بود. مجموعه دادههای نامتوازن یکی از چالشهای پیش روی طراحی سیستمهای پزشک‏یار برای طبقهبندی و تعیین وضعیت بیمار محسوب می‏شود که در این پژوهش از روشهای سطح داده برای حل آن استفاده شد. روش بررسی: در این مطالعه برای طبقهبندی دادههای 918 نفر، سه الگوریتم adaboost.m1، k تا نزدیکترین همسایه و شبکه عصبی احتمالی به خدمت گرفته شد. از آنجا که دادههای این مطالعه نامتوازن بود، برای حل این مساله از روش بیش نمونه‏برداری تصادفی کلاس اقلیت، زیرنمونه برداری تصادفی کلاس اکثریت و بیش نمونه‏برداری مصنوعی کلاس اقلیت استفاده شد. به منظور پیاده‏سازی الگوریتمها از امکانات و ابزارهای نرمافزار «متلب» و «آر» استفاده گردید. همچنین برای ورودی الگوریتمهای طبقهبندی از 60 متغیر مندرج در کاربرگهای شرح حال و معاینه فیزیکی مراجعان استفاده شد. معیارهای دقت و f-measure به منظور ارزیابی در مرحله آزمون الگوریتمها مورد استفاده قرار گرفت. یافته‏ها: بر اساس معیارهای دقت و f-measure، بهترین عملکرد الگوریتمهای سهگانه این مطالعه در مواجهه با مجموعه داده تولیدشده با روش بیش نمونه‏برداری مصنوعی کلاس اقلیت بود. در این راستا عملکرد الگوریتمهای adaboost.m1، k تا نزدیکترین همسایه و شبکه عصبی احتمالی در مواجهه با مجموعه داده مذکور و بر اساس معیارهای دقت و f-measure به ترتیب عبارتند از: 5/93 و 6/93، 5/79 و 7/87 و 86 و 9/91 بدست آمد. نتیجه‏گیری: روشهای مختلفی برای حل مساله عدم توازن مجموعه دادهها به منظور طبقهبندی وجود دارد؛ نمونهگیری مجدد که از روشهای سطح داده محسوب میشود یکی از متداولترین آنهاست. از سه روش نمونهگیری مجددی که در این مطالعه استفاده شد، بهترین عملکرد طبقه‏بندها در مواجهه با مجموعه داده ایجاد شده در نتیجه نمونهگیری مجدد به روش بیش نمونه‏برداری مصنوعی کلاس اقلیت بود. از بین الگوریتمهای به خدمت گرفته شده و بر اساس معیارهای دقت و f-measure بهترین عملکرد در تمامی مجموعه دادههای این مطالعه متعلق به الگوریتم adaboost.m1 بود.

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

طبقه‏بندی داده‌های نامتوازن در تشخیص اولیه بیماری‌های پستان با روش‌های آدابوست، شبکه عصبی احتمالی و K تا نزدیک‏ترین همسایه

متن کامل

ارزیابی روش غیرپارامتریک k- نزدیکترین همسایه و سیستم‌های شبکه عصبی مصنوعی برای برآورد هدایت هیدرولیکی اشباع خاک

هدایت هیدرولیکی اشباع خاک از مهم ترین ویژگی های فیزیکی خاک است لیکن در بیشتر موارد به علت محدودیت‌های عملی و یا هزینه‌ای، اندازه‌گیری آن با دشواری همراه است. در این پژوهش مدل‌های مختلف شبکه های عصبی مصنوعی با نوعی از الگوریتم‌های غیرپارامتریک از نوع یادگیرنده‌های تنبل موسوم به k-نزدیکترین همسایه، برای تخمین هدایت هیدرولیکی اشباع خاک از روی داده‌های سهل‌الوصول خاک، مورد مقایسه قرار گرفت. در این ...

متن کامل

مدل سازی جریان رودخانه باراندوزچای با استفاده از روش نزدیکترین k- همسایه و روش های هوشمند

پیشبینی دقیق جریان رودخانه در طراحی، بهرهبرداری و برنامهریزی منابع آب از اهمیت بسزایی برخوردار است. در این مطالعه، عملکرد روشهای ناپارامتری نزدیکترین همسایه، فازی- عصبی تطبیقی و روش رگرسیون بردار پشتیبان در پیشبینی جریان رودخانه ارزیابی شده است. برای مدلسازی از دادههای جریان 36 ساله ایستگاه هیدرومتری دیزج واقع بر رودخانه باراندوزچای (در مقیاس زمانی ماهانه) استفاده گردید. ترکیبات مختلفی ا...

متن کامل

ارزیابی عملکرد رهیافت توسعه یافته‌ی نزدیکترین همسایه در شبیه سازی داده های هواشناسی روزانه

مولدهای هواشناسی (Weather Generators) با هدف تطویل سری اطلاعات انواع متغیرهای وضع هوا اعم از بارش، دما و رطوبت نسبی، برای ارتقاءِ فهم و درک از عملکرد هر سیستمی که اقلیم عامل تاثیرگذار بر آن باشد، توسعه یافته‌اند. الگوریتم‌های متفاوتی از این مولدها در دو نوع کلی پارامتری و ناپارامتری تا به امروز ارائه شده‌اند. در این مطالعه کارایی مولد ناپارامتری k نزدیکترین همسایه با قابلیت برونیابی داده‌ها در س...

متن کامل

بررسی شبکه های عصبی کانولوشن عمیق جهت تشخیص سرطان پستان در تصاویر ترموگرافی

چکیده زمینه و هدف: سیستم‌های تشخیص Computer-aided design به طور گسترده در تشخیص افتراقی سرطان سینه استفاده می‌شوند. بنابراین بهبود دقت یک سیستم CAD به یکی از حوزه‌های مهم تحقیقاتی تبدیل شده‌است. در این مقاله به بررسی سیستم های CAD مبتنی بر شبکه های عصبی عمیق از نوع کانولوشن در جهت تشخیص سرطان پستان در تصاویر ترموگرافی پرداخته شد. روش بررسی: برای تحلیل مدل‌ها از پایگاه داده “Database...

متن کامل

پیاده سازی سیستم تصمیم یار مبتنی بر شبکه عصبی احتمالی جهت تشخیص نوع سرطان پستان

چکیده مقدمه: سرطان پستان رایج‌ترین شکل سرطان در زنان است. تشخیص به‌موقع سرطان شانس زنده ماندن بیمار را افزایش می‌دهد. شبکه‌های عصبی مصنوعی از روش‌های نوین مدل‌سازی و پیش‌بینی هستند. هدف از این مطالعه تشخیص خوش‌خیم یا بدخیم بودن توده‌های سرطان پستان است که برای این منظور سیستم تصمیم‌یار مبتنی بر شبکه عصبی احتمالی طراحی شد. روش بررسی: در این مطالعه یک شبکه عصبی احتمالی طراحی شد که بر اساس متغیره...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}

عنوان ژورنال:

بیماری های پستان

جلد ۹، شماره ۲، صفحات ۷-۱۸

کلمات کلیدی

عدم توازن داده طبقه‏بندی بیماری پستان k adaboost.m1 تا نزدیک ترین همسایه شبکه عصبی احتمالی نمونه‏گیری مجدد.

میزبانی شده توسط پلتفرم ابری doprax.com